AI资讯新闻榜单内容搜索- LLM

LeCun力荐的JEPA杀入LLM，用CV的思路训练LLM，性能鲁棒性双丰收

LeCun 这次不是批评 LLM，而是亲自改造。当前 LLM 的训练（包括预训练、微调和评估）主要依赖于在「输入空间」进行重构与生成，例如预测下一个词。而在 CV 领域，基于「嵌入空间」的训练目标，如联合嵌入预测架构（JEPA），已被证明远优于在输入空间操作的同类方法。

来自主题: AI技术研报

6855 点击 2025-09-23 10:12

IBM发布LLM工具调用判断器ToolRM，工具调用准确率提高25%

Tool-Calling作为Agent的核心模块，智能体的双手，这项关键能力允许 LLM 调用外部函数，例如应用程序接口（APIs）、数据库、计算器和搜索引擎，决定了AI Agent的可执行边界。

来自主题: AI技术研报

7495 点击 2025-09-22 10:34

腾讯优图重磅开源Youtu-GraphRAG，实现图检索增强技术新突破

图检索增强生成（GraphRAG）已成为大模型解决复杂领域知识问答的重要解决方案之一。然而，当前学界和开源界的方案都面临着三大关键痛点：开销巨大：通过 LLM 构建图谱及社区，Token 消耗大，耗

来自主题: AI技术研报

8130 点击 2025-09-14 10:45

她们估值840亿，刚发了第一个AI成果

刚刚，0产出估值就已冲破120亿美元的Thinking Machines，终于发布首篇研究博客。

来自主题: AI技术研报

6471 点击 2025-09-11 17:21

Agentic Deep Research新范式，推理能力再突破，可信度增加，蚂蚁安全团队出品

尽管 LLM 的能力与日俱增，但其在复杂任务上的表现仍受限于静态的内部知识。为从根本上解决这一限制，突破 AI 能力界限，业界研究者们提出了 Agentic Deep Research 系统，在该系统中基于 LLM 的 Agent 通过自主推理、调用搜索引擎和迭代地整合信息来给出全面、有深度且正确性有保障的解决方案。

来自主题: AI技术研报

6991 点击 2025-08-27 17:05

LLM中最难搞的表格最新梳理，需要什么请自取

您可能已经在产品里放进了问答、总结、甚至自动报表模块，但表格一上来，体验就变味了，这不奇怪。表格是二维、带结构、还经常跨表跨文，和纯文本完全不一样；项目作者在《Tabular Data Understanding with LLMs》里把这件事掰开揉碎，从输入表示到任务版图，再到评测与未来方向都梳理清楚了。

来自主题: AI资讯

6993 点击 2025-08-21 11:12